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加 权 有 向 网 络 中心 节 点 识别 的 分 解 算 法 研究 - 
刘 臣 ， 李 丹 丹 ， 韩 ” 林 ， 安 咏 雪 


(上 海 理 工大 学 管理 学 院 ， 上 海 200093) 


摘 要 :目前 复杂 网 络 节点 重要 性 识别 算法 主要 集中 在 无 权 、 无 向 网 络 上 , 不 能 全 面 地 描述 真实 世界 复杂 网 络 的 情况 。 
例如 ， 大 部 分 中 心性 度量 方法 仅仅 考虑 单一 指标 ， 忽 略 了 节点 出 度 与 入 度 的 差异 ， 且 忽视 了 权重 的 重要 性 。 基 于 有 向 
加 权 复 杂 网 络 ， 综 合 考虑 节点 出 度 与 入 度 的 差异 ， 以 及 权 值 在 真实 网 络 中 的 实际 重要 性 ， 提 出 了 一 种 基于 出 度 、 入 度 
和 权 值 的 中 心 节 点 识别 算法 一 一 cw- 党 分 解 算法 。 为 了 验证 该 算法 的 有 效 性 ， 利 用 W-SIR 传播 模型 在 真实 复杂 网 络 上 
进行 病毒 传播 仿真 实验 ， 结 果 表 明 ，cw- 党 分 解 方法 能 够 有 效 地 对 节点 进行 分 级 排序 ， 识 别 出 具 有 高 扩散 能 力 的 节点 。 
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Decomposition algorithms of center node in directed-weighted network 


Liu Chen, Li Dandan, Han Lin, An Yongxue 
(Business School, University of Shanghai for Science & Technology, Shanghai 200093, China) 


Abstract: The existing evaluation methods for node importance in complex network mainly focus on un-directed and un- 
weighed networks, and can’t describe the real-world network completely. For example, most centrality measures only consider 
asingle indicator, ignoring the difference between out-degree and in-degree of the node, and neglecting the importance of weight. 
Based on the directed-weighted complex network, this paper proposes a center node recognition algorithm, cw-shell 
decomposition method, which is based on out-degree, in-degree and weight, considering the difference between out-degree and 
in-degree of the node, and the practical importance of weight in real network. In order to verify the effectiveness of the new 
index, the weighted-susceptible-infectious-recovered model is used to simulate spreading process on real-world networks. The 


results show that the cw-shell decomposition method can rank the nodes efficiently, and identify the nodes with higher diffusion 


ability. 


=— Key Words: cross degree; c-shell; k-shell; node importance; transmission dynamics 


络 中 节点 重要 性 排序 的 几 个 常用 指标 有 度 值 、 介 数 、k- 壳 值 等 ， 
用 于 有 向 网 络 中 节点 重要 性 排序 的 两 个 经 典 算 法 一 一 HITS 算 
随 着 信息 科技 的 迅猛 发 展 ， 复 杂 网 络 渗入 人 类 生活 的 方 方 ” 法 和 PageRank 算法 都 是 来 自 WWW 上 的 网 页 排序 上 3。 
面 面 。 无 论 是 病毒 的 传播 , 还 是 观点 谣言 的 扩散 ,“ 谁 是 网 络 中 Newman 等 人 [9 通过 对 电子 邮件 网 络 的 研究 结果 表明 ， 去 
最 重要 的 节点 ? 如 何 有 效 扩散 信息 ?”, 成 为 学 者 们 关注 的 热点 。 ” 掉 网 络 中 度 最 大 的 节点 后 ， 网 络 会 变 得 非常 脆弱 。 度 指标 计算 
Goel 等 人 中 通过 对 七 个 在 线 平台 数据 的 观察 收集 ， 发 现 大 部 分 。 简单 ， 时 间 复 杂 度 低 ， 适 合 大 型 网 络 。 然 而 ， 度 指标 只 反映 ] 
的 级 联 是 小 而 且 浅 的 ， 并 且 可 以 通过 一 些 相 似 的 树 结构 进行 描 。 ”节点 局 部 特征 ， 没 有 对 邻接 节点 的 连接 状况 进行 描述 。 
述 。 提 出 即使 存在 一 些 大 的 级 联 ， 也 是 得 益 于 媒体 效应 ， 例 如 ”Freeman 中 用 介 数 定义 了 节点 的 重要 性 , 即 经 过 某 个 节点 的 最 短 
粉丝 们 对 喜欢 的 歌手 或 者 产品 的 热切 关注 。 所 以 作者 建议 ， 为 。” 路 径 的 数目 ， 它 刻画 了 节点 i 对 于 网 络 中 节点 对 之 间 沿 着 最 短 
了 扩大 网 络 传播 范围 ， 网 络 营销 者 和 相关 研究 人 员 应 该 降低 分 ”路 径 传 输 信息 的 控制 能 力 。 然 而 ， 介 数 因 需 要 计算 最 短路 径 而 
享 成 本 ， 摸 清楚 人 和 群 中 的 中 心 节点 群 ， 把 注意 力 放 在 加 强 重 要 ” 导致 算法 的 时 间 复 杂 度 较 高 , 不 适用 于 大 型 复杂 网 络 。Kitsak 等 
节点 的 传播 潜力 上 。 人 外 提出 节点 在 网 络 中 的 位 置 是 影响 其 重要 性 的 主要 因素 ， 在 
如 何 识 别 重 要 节点 ， 已 有 大 量 的 研究 ， 例 如 ， 用 于 无 向 网 。 单个 传播 源 的 情况 下 ， 最 具 影 响 力 的 节点 并 非 是 那些 度 最 大 或 


二 


i 


基金 项 目 : 国家 自然 科学 基金 资助 项 目 〈71401107) 

作者 简介 : 刘 臣 〈1981-)， 男 ， 河 南 南 阳 人 ， 副 教授 ， 博 士 ， 主 要 研究 方向 为 互联 网 用 户 行为 、Web 数据 挖掘; 李 丹 丹 +〈1989-)， 女 〈 通 信 作 者 )， 安 徽 
阜阳 人 ， 硕 士 研究 生 ， 主 要 研究 方向 为 复杂 网 络 〈1223208716@qq.com); 韩 林 〈1992-)， 男 ， 山 东 烟 台 人 ， 硕 士 研究 生 ， 主 要 研究 方向 为 机 器 学 习 ; 安 咏 雪 
〈《1991-)， 女 ， 山 东 日 照 人 ， 硕 士 研究 生 ， 主 要 研究 方向 为 互联 网 用 户 行为 . 


201805.00237V1 


chinaXiv 


录用 稿 


者 介 数 最 大 的 节点 


杂 度 低 ， 适 | 


在 疾病 传播 中 最 有 影响 力 的 节点 。 然 而 ，k- 过 分解 方法 不 适用 
树 状 网 络 、BA 网 络 ， 因 为 该 类 网 络 的 所 有 节点 ks 值 相等 ， 从 
而 导致 ks 指标 无 法 度量 其 节点 的 重要 性 。Bryan 等 四 提出 的 


PageRank 算法 是 | 


于 搜索 引擎 中 网 页 排序 的 经 典 算法 , 可 用 


有 向 网 络 。PageRank 算法 的 基本 思想 是 ， 


， 而 是 k- 壳 值 最 大 的 节点 。k- 壳 指标 时 间 复 
于 大 型 网 络 ， 而 


比 度 、 介 数 指标 更 能 准确 识别 


和 SIS 模型 以 及 实际 网 络 数据 证 明了 ， 最 


Chinax | 
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有 影响 力 的 节点 并 非 


是 那些 度 最 大 或 者 介 数 最 大 的 节点 ， 而 是 k- 壳 值 最 大 的 节点 。 


Ll 


然而 ，k- 核 很 小 的 节点 


屋 : 


播 能 


WWW 上 一 个 页 面 的 


重要 性 取决 于 指向 


中 存在 孤立 节点 或 社团 时 ， 会 昌 
1998 年 提出 HITS 算法 ， 


Kleinberg00 于 


的 数量 和 质量 。 然 而 ， 当 网 络 
一 的 问题 。 
其 基本 思想 是 ,每 个 网 


它 的 其 他 页 面 和 


CE 
洁 
淮 
意 
eal 
= 


页 的 重要 性 
较为 


学 界 应 | 


有 两 种 刻画 
泛 ， 
快 ， 减 少 了 时 间 复 杂 度 。 然 而 HITS 不 能 识别 非 


指标 一 一 权威 性 和 枢纽 型 .HITS 算法 在 
由 于 它 需 要 的 迭代 次 数 更 少 ， 收 敛 速度 更 
正常 目的 的 网 


页 引用 ， 导 致 计算 结果 与 实际 有 偏差 。 
周 立 欣 等 人 0 在 k- 壳 分 解 方 法 
网 络 的 c- 壳 分 解 方法 ， 证 明了 该 方法 具有 较 好 的 区 分 度 ， 能 够 
向 网 络 中 的 重要 节点 。 然 而 ，c- 壳 分 解 方法 


识别 


于 加 权 网 络 。 


i 


的 情 


的 基础 上 提出 适用 于 有 向 


网 络 , 因为 该 类 网 


要 性 。 


k- 壳 分 解 方法 通过 递归 


影响 的 节点 ， 然 而 传统 的 k- 核 分 解 方法 无 法 对 这 部 分 节点 
进行 度量 03。 此 外 ，k- 壳 分 解 方法 不 适用 树 状 网 络 、 
络 的 所 有 节点 ks 值 相等 , 无 法 衡量 节点 的 重 
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FPF 也 存在 对 网 络 的 传播 动力 学 产生 巨大 


的 传 


地 移 除 网 络 中 所 有 度 值 小 于 等 于 K 


的 节点 ， 揭 示 网 络 的 过 结构 性 质 和 网 络 的 层次 性 质 。 


设 网 络 G=(E,V) 是 由 V 


个 节点 和 EE 条 连 边 组 成 的 网 络 。k- 


过 定义: 由 集合 


V， 其 度 值 均 大 于 的 最 大 子 网 络 被 称 为 k- 核 ， 


导出 的 子 


网 络 H=(C,E/C), 满 足 C 中 任意 节点 
其 中 属于 k- 核 


但 不 属于 (k+1)- 核 的 那 部 分 节点 称 为 kr 壳 ， 简 称 ks。 


1.1.2 基于 交叉 度 的 c- 党 分 解 算 法 


向 网 络 转 


该 方法 是 把 


分 解 。 在 有 向 网 络 重要 节点 


大 多 数 的 中 心性 方法 ， 包 括 k- 壳 分 解法 ， 都 是 在 无 权 网 络 
下 设计 的 。 然 而 ， 真 实 的 网 络 是 加 权 的 ， 而 且 他 们 的 权 


重 


者 述 了 基础 系统 的 性 能 属性 。 例 如 ， 在 经 济 贸 易 网 络 中 ， 权 


重 表示 着 一 些 测量 属性 ， 如 贸易 流 ， 资 金 流 等 。 在 一 个 加 权 网 


络 ， 节 点 至 少 可 以 通过 两 个 属性 进行 描述 ， 
大 


度 和 权重 。 然 而 权 


重 是 网 络 链接 的 属性 ， 
该 节点 的 所 有 链接 的 权重 之 和 来 定义 C。 在 一 个 网 络 中 即 存 在 
， 也 存在 低 度 高 权重 的 节点 。 
中 有 两 种 主要 的 方法 ， 一 种 办 法 是 完全 忽视 权重 。 另 一 种 是 只 


氏 权 重 的 节点 


高 度 


变 为 无 向 网 络 ， 再 进行 经 典 的 K- 壳 
的 识别 过 程 中 ， 度 指标 将 节点 的 入 


度 和 出 度 简单 相 加 ， 无 法 有 效 区 分 两 者 的 差异 0 了 4。 节 点 交叉 度 
(cross degree ) 的 物理 意义 


过 该 节点 的 次 数 。 节 点 的 交叉 度 


个 节点 的 邻接 点 之 间 的 连 线 穿 


生 


| 友 表 不: 


k° =(#" 


+1) (kx +1) -1 


和 的 不 同 取 值 影响 节点 的 交叉 度 值 ， 从 而 区 分 节点 的 出 度 
与 入 度 的 重要 性 。 式 (1) 中 , 作者 在 网 络 中 额外 


此 一 个 节点 的 权重 可 以 通过 计算 通过 


在 以 往 的 研究 


考虑 权重 超过 任意 选择 的 阐 值 的 链 而 过 滤 掉 剩余 的 部 分 。 这 种 


法 的 缺点 是 需要 选择 一 个 适当 的 权重 临界 值 。 这 样 的 话 可 能 
会 删除 低 权 重 而 度 高 的 节点 ( 低 于 闵 值 )。 男 外, 通过 忽略 低 于 


病 值 的 链接 ， 会 使 得 网 络 中 的 一 些 节 点 断 开 链 接 而 变 得 越 来 越 


稀 玻 0 。 
针对 上 述 问题 


， 本 文 提出 了 一 种 基于 


压 
洱 


节点 重要 性 评价 


指标 ， 


交叉 度 (cw) 指 标 ， 


方法 对 加 权 有 向 网 络 进行 
健康 网 络 的 仿真 结果 表明 : 该 指标 能 有 效 的 度量 节点 的 重要 性 。 
如 下 : 
并 提出 了 cw- 过 分 解 方 法 。 然后， 利用 


本 文 的 结构 安排 


I 算法 ， 


江 


cw- 壳 分 解 。 对 美国 航 


首先 介绍 了 基于 壳 数 分 解 的 中 心 节点 识 
W-SIR 传播 模 


性 。 


型 在 真实 复杂 网 络 上 模拟 病毒 传播 仿真 实验 ， 验 证 方法 的 有 部 
最 后 提出 结论 。 


1 ”加 权 有 向 网 络 中心 节 点 识别 算法 


1.1 


基于 壳 数 的 中 心 节点 识别 算法 
1.1.1 k- 壳 分 解 算法 


Kitsak 等 人 馈 于 2010 年 首次 提出 了 节点 在 网 络 中 的 位 置 是 


影响 其 重要 性 的 主 


要 因素 ， 在 单个 传播 源 的 情况 下 ， 基 于 SIR 


基于 图 1, 对 


兽 加 一 个 节点 


且 将 它 与 已 有 的 所 有 节点 双 疝 链接 ， 于 是 得 到 n+l 的 网 络 ， 
这 样 就 能 够 度量 出 度 或 入 度 为 零 的 节点 重要 性 ， 
网 络 是 强 连 通 网 络 。 


因此 这 个 新 的 


c- 壳 分 解法 是 把 


网 络 进行 c- 过 分 解 , 对 交叉 度 指标 进行 论证 。 
向 网 络 转变 为 无 向 网 络 ， 再 ; 


进行 经 典 的 k- 壳 


分 解 。 该 方法 适合 K- 壳 分 解 方法 的 分 级 过 程 。 但 是 ， 是 基于 交 
计算 结果 


叉 度 的 蔡 代 度量 。 


如 表 1 所 示 。 


图 1 有 向 网 络 图 

表 1 c- 壳 分 解 结果 
c- 壳 k* 值 节点 
1- 索 k=0.4142 9,10,11,13,14,15,16,17 
2- 壳 ”k=1.0000 8 
3- 壳 。 k=1.4494 2,3,4,6,7 
4- 壳 。 k=1.6458 1 
5- 壳 ”k=2.4641 12 
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于 最 小 k- 核 节点 的 ks 值 相 同 , 而且 根据 k- 核 分 解 原理 ， 
度 为 1 以 及 大 部 分 介 数 为 0 的 节点 属于 最 小 k- 核 节点 ， 因 此 仅 
芭 依 靠 节点 自身 k- 核 、 度 或 介 数 信息 不 能 很 好 的 区 分 这 类 节点 
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移 除 节点 与 其 邻接 点 的 连 边 。 此 时 剩 下 的 网 络 中 可 能 有 出 现 一 
些 新 的 cw 值 小 于 或 等 于 cw 的 节点 ， 再 把 这 些 节点 与 其 邻接 
点 的 连 边 移 除 。 重 复 此 操作 直至 网 络 中 不 再 有 cw 值 小 于 或 等 
于 cr 的 节点 为 止 。 被 移 除 的 节点 的 集合 , 称 为 网 络 的 cw- 壳 。 


的 传播 能 力 03。 根 据 表 1， 可 以 得 出 交叉 度 指标 可 以 用 于 识别 
最 小 k- 核 节点 中 对 网 络 传播 重要 的 节点 ， 且 具有 更 高 的 区 分 度 
能 够 识别 出 有 向 网 络 中 的 重要 节点 。 

周 立 欣 0 等 人 通过 在 SIR 模型 上 进行 仿真 实验 , 研究 交叉 
度 值 与 度 值 都 相同 的 节点 在 网 络 中 的 平均 传播 范围 Mke, )， 
从 而 对 比分 析 c- 过 分解 方法 与 度 方法 在 准确 识别 重要 节点 方面 
的 差异 。 结 果 表明 ks 值 越 大 的 节点 在 网 络 中 的 平均 传播 范围 
M(ks, k) 就 越 大 。k: 值 相近 的 节点 ， 其 传播 能 力 相 近 ， 且 Mke， 
k) 的 取 值 与 节点 的 度 值 关联 很 小 。 度 值 相 同 的 节点 ， 其 传播 能 
力 却 存在 明显 的 差异 ， 且 表明 了 网 络 中 存在 度 值 很 大 而 传播 能 
力 有 限 的 节点 。 同 理 ， 证 明了 c- 壳 分 解 算法 比 介 数 中 心性 方法 
准确 的 衡量 节点 的 传播 能 力 和 重要 性 程度 。 
但 是 ，c- 壳 分 解 方法 无 法 直接 用 于 加 权 网 络 。 因 此 本 文 提 
出 交叉 点 权 的 概念 。 
1.2 cw- 壳 分 解 算法 
1.2.1 交叉 点 权 

这 个 方法 考虑 了 节点 的 出 度 和 入 度 ， 以 及 与 邻接 节点 连 边 
的 权重 因素 。 而 一 个 节点 的 权重 可 以 表示 为 经 过 该 节点 的 所 有 
链接 的 权重 之 和 , 因此 为 每 个 节点 分 配 交 叉 点 权 。 一 个 节点 i 的 
交叉 点 权 被 定义 为 : 


lb (B11 -1 ©) 


jeN jeN 


ey 


其 中 :N 为 节点 i 的 邻 节 点 集合 ， 之 几 是 所 有 以 节点 i 为 起 点 


jeN 


的 连 边 的 权重 之 和 ， 2 是 所 有 以 节点 i 为 终点 的 连 边 的 权重 


之 和 ,参数 4 的 意义 同上 文 ,是 为 了 区 分 出 度 与 入 度 的 重要 性 。 


因此 ， 


cw = (2 十 jb + 一 1 (3) 


在 不 加 权 的 网 络 中 , 即 wiF1， 一 个 节点 的 交叉 点 权 等 同 了 

交叉 度 ， 这 样 可 以 使 用 c- 壳 方法 继续 同一 网 络 的 分 层 。 

1.2.2 基于 交叉 点 权 的 cw- 沉 分 解 算 法 实现 过 程 
cw- 壳 分 解法 是 把 加 权 有 向 网 络 转变 为 无 权 无 向 网 络 ,再 进 

行经 典 的 k- 壳 分 解 。 该 方法 适合 k- 壳 分 解 方 法 的 分 级 过 程 ， 但 

是 , 是 基于 交叉 点 权 的 蔡 代 度量 。 cw- 过 分 解 算法 通过 递归 地 移 

除 网 络 中 所 有 cw 值 小 于 或 等 于 cww (网络 中 最 小 的 cw 值 ) 的 


nm 


节点 , 从 而 将 网 络 划 分 为 若干 层 , 每 一 层 壳 的 节点 的 cw 值 相等 。 


有 具体 的 算法 实现 过 程 如 下 : 
a) 根 据 式 (3)， 计 算 网 络 中 所 有 节点 的 cw 值 ; 
b) 依 次 移 除 网 络 中 所 有 cw 值 小 于 或 等 于 cw 的 节点 ， 


本 文 , 仅 讨 论 4=1/2 的 情况 , 这 样 就 认为 入 度 和 出 度 同 样 重要 。 


余下 的 节点 的 集合 称 为 网 络 的 cew- 核 ; 

c) 继 续 剥 过 操作， 重复 a)b)， 直 至 网 络 中 所 有 节点 都 被 移 
除 。 节 点 的 cw 值 越 大 ， 表 明 节 点 与 接近 cw- 壳 分 解 的 最 内 层 ， 
影响 力 越 大 。 通 过 cw- 过 分解 算法 能 够 确定 所 有 节点 在 网 络 中 
所 处 的 层级 , 并 给 出 节点 的 重要 性 排序 , 识别 网 络 的 中 心 节点 。 
1.2.3 实例 

为 了 突出 未 加 权 方 法 的 缺陷 ， 假 设 网 络 加 权 ， 基 于 图 1， 
假设 W110=2.5, Ws,12=3.5, W1,6=0.5, W3,7=0.5, Wil217=2，W43=2， 
其 余 均 为 1。 依据 cw- 壳 分 解 方法 对 图 1 网 络 进行 分 解 。 结果 如 
表 2 所 示 。 


表 2 cw- 壳 分 解 结 


cw- 过 cw 值 节点 

1- 壳  cw=0.4142 8,9,11,13,14,15,16,17 
2- 壳 cw=0.5811 6,7 

3- 壳  cw=0.7321 17 

4- 过 cw=0.8708 10 

5- 过  cw=1.1213 1,2,3,4,5,12 


依据 k- 壳 分 解 方 法 ， 节 点 10 将 被 放置 在 网 络 的 边缘 ， 即 
ks=1， 即 使 它 是 强 连 接 到 核心 节点 中 的 一 个 。 在 真实 网 络 这 种 
强 连 接 链 路 ， 表 示 该 特定 节点 是 更 为 重要 的 外。 但 这 不 是 能 通 
过 k- 壳 分 解 方法 所 计算 出 的 层 状 结构 能 够 进行 描绘 的 。 因 此 通 
过 cw- 壳 分 解 方 法 计算 出 cwio = 0.8708 ，cw, = 0.4142 ,节点 10 
的 重要 性 就 高 于 节点 11 的 重要 性 ， 这 样 就 突出 ] 


性 


昌 


其 实际 重要 


2 cw- 壳 分 解 算法 的 有 效 性 分 析 


首先 ， 


.和 
1 CW- 郊 


本 节 介 绍 了 cw- 过 算法 在 真实 复杂 网 络 中 的 应 用 。 
在 Koblenz 网 站 获得 数据 集 , 进行 数据 描述 。 然后， 
算法 进行 网 络 分 解 ,得 到 网 络 ew- 壳 结构 ,确定 网 络 节点 的 中 心 
程度 。 最后, 利用 W-SIR 模型 模拟 病毒 传播 仿真 实验 , 检验 中 
心 程度 不 同 的 节点 在 网 络 中 的 传播 范围 和 重要 性 程度 ， 从 而 验 
证 cw- 壳 分 解 算法 的 有 效 性 。 
2.1 数据 集 
通过 Koblenz 网 站 获得 如 下 数据 集 ， 如 表 3 所 示 。 
a) Adolescenthealth: 这 是 1994 年 的 一 个 有 关 青 少年 友谊 
关系 的 调查 。 节 点 表示 学 生 ， 有 向 边 表示 学 生 甲 选择 学 生 乙 作 
为 朋友 。 权 重 表示 两 者 的 亲密 程度 ， 值 越 大 ， 关 系 越 密切 。 节 
点 之 间 没 有 连 边 ， 表 示 无 往来 。 
b) US airport: 这 是 2010 年 的 美国 机 场 运作 网 络 。 节 点 表 
示 机 场 ， 有 向 边 表示 飞机 由 机 场 A 飞 向 机 场 B， 权 重 表示 该 方 
向 飞行 的 次 数 。 


注 


i 
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表 3 复杂 网 络 数据 集 
网 络 网 络 类 型 ”NN NE K C d 
Adolescent health D+ 2539 12969 10.216 14.20% 10 
US airport D+ 1,574 28,236 35.878 38.40% 8 


表 3 中 , 给 出 了 网 络 的 一 些 详细 的 统计 性 质 。D+ 表 示 该 网 
络 是 加 权 有 向 网 络 , Nw 是 节点 总 数 ,NE 边 数 ,k 网 络 的 平均 度 ， 
C 网 络 平均 聚 类 系数 ，d 直径 。 
2.2”W-SIR 模型 

近年 来 ，SIR 模型 被 用 于 网 络 研究 ， 用 来 探索 疾病 传播 ， 
经 济 危 机 草 延 ， 以 及 信息 和 谣言 传播 等 0418。 由 于 感 兴趣 的 是 
加 权 网 络 ， 所 以 把 有 关 权 重 的 概念 引入 到 SIR 模型 ,如 公式 4。 
这 个 模型 最 初 是 为 了 模拟 经 济 危 机 的 传播 四， 它 假设 节点 i 以 
概率 Pij 感染 节点 j， 且 每 个 链 路 感染 的 概率 不 同 ， 公 式 : 


So 


py < mw/ 塘 (4) 


其 中 : wj 是 以 节点 i 为 起 点 ， 以 节点 j 为 终点 的 所 有 和 链 的 总 权 


重 。 哆 是 以 节点 j 为 终点 的 所 有 链 的 总 权重 。 比 率 Wj/ 唤 被 用 


pb 


来 作为 节点 j 被 节点 i 感染 可 能 性 的 一 个 因素 。m 是 可 以 扩大 
的 自由 参数 ， 例 如 危机 的 严重 性 ， 一 种 病毒 是 如 何 传染 的 ， 一 
个 谣言 的 重要 性 等 。 这 个 模型 称 为 加 权 SIR 模型 (W-SIR)。 

W-SIR 的 建 模 过 程 如 下 。 首 先 ， 将 所 有 的 节点 定义 为 易 感 
染 者 S。 接 着 ， 选 择 一 个 节点 1， 并 且 被 假定 为 被 感染 者 I。 这 
个 节点 会 在 第 一 时 间 里 以 概率 Pi 感染 其 相 邻 节点 。 这 将 导致 
所 有 被 感染 的 节点 由 状态 S 转换 为 I， 而 发 起 这 个 过 程 的 节点 
转换 为 R 状态 ， 并 不 能 再 感染 其 他 节点 或 被 感染 。 不 断 重 复 上 
述 步 又 ， 并 且 所 有 被 感染 的 节点 都 试图 感染 它 的 邻接 S 节点 。 
这 个 过 程 一 直 持续 到 网 络 中 没有 可 以 被 感染 的 节点 或 者 所 有 的 
节点 都 已 被 感染 为 止 。 
2.3 ”仿真 分 析 

对 于 给 定 的 m 值 ， 对 每 个 单独 的 节点 ， 在 W-SIR 模型 上 
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E(D)=1 一 AMcw/ My (5) 
é.(p)=1-—M. IM, (0) 
Eca(p)=1- Mes /My (7) 


显然 ， 当 s(P) 越 小 时 ， 说 明 该 指标 的 精确 度 越 高 ， 传 播 能 
力 越 强 ， 能 够 更 加 有 效 地 识别 出 网 络 中 的 中 心 节点 。 


005 
1 2 3 4 5 
离 核心 距离 


图 2 网 络 Adolescent health(m=5),US airporttm=1) 每 层 壳 距 核心 距离 
与 该 层 壳 所 有 节点 平均 感染 能 力 的 关系 比较 


3 表明 ， 随 着 选取 比例 p 的 不 断 增加 ， 和 名 个 指标 的 准确 
性 不 断 增加 。 对 于 网 络 US airport(m=1), 当 p 小 于 1.5% 时 ， 
Ew(P)<E.(P)< Ecs(P) , 即 cw- 壳 分 解 方 法 的 误差 均 小 于 度 指标 
和 介 数 指标 ， 表 明 cw- 过 分解 方 法 比 度 指标 和 介 数 指标 更 加 的 
E 确 。 对 于 网 络 Adolescent health (m=4)， 总 有 ， 
64(P) < E56(P) < Ecg(P), 即 cw- 壳 分 解 方 法 的 误差 小 于 介 数 指标 ， 


进行 100 次 实验 ， 每 一 个 节点 的 感染 能 力 都 是 这 100 次 实验 实 
纲 的 平均 值 。 然 后 根据 cw- 壳 分 解 方法 得 到 的 壳 结 构 ， 分 析 每 
层 壳 的 传染 能 力 。 

2.3.1 cw- 壳 分 解 方法 的 精确 度 

首先 ， 分 别 依据 节点 的 度 ， 介 数 和 cw- 壳 分 解 方法 分 解 网 
络 ， 得 到 该 网 络 的 壳 结 构 ， 并 根据 节点 距 核心 的 距离 为 得 到 壳 


表明 cw- 壳 分 解 方法 比 介 数 指标 更 加 的 准确 。 相 比 于 另外 两 种 
方法 ， 基 于 介 数 识别 最 有 效 传播 者 的 方法 最 不 准确 。 由 仿真 结 
果 可 以 得 出 ,cw- 壳 分 解 方法 更 能 够 合理 有 效 地 对 节点 进行 分 级 
排序 ， 把 具有 高 扩散 能 力 的 节点 放置 在 离 核 心 近 的 位 置 。 
2.3.2 每 层 壳 的 同 质 性 
为 了 验证 cw- 壳 分 解 方法 的 准确 性 ， 文 中 测试 了 每 层 壳 的 


排序 。 然 后 ， 计 算 每 层 壳 的 所 有 节点 平均 感染 范围 ,估计 过 的。 同 质 性 ， 即 同一 层 壳 的 所 有 节点 应 具有 相似 的 感染 能 力 。 为 了 
传播 潜力 。 如 图 2 所 示 。 做 到 这 一 点 ， 在 给 定 的 m 值 下 ， 依 据 cw 值 对 网 络 分 层 ， 层 数 

图 2 中 ， 通 过 cw- 壳 的 分 解 方 法 获得 的 中 心 节点 能 够 引发 。 用 rf 表示 ， 总 的 节点 数 用 n 表示 。 则 此 次 验证 就 可 以 看 做 : 在 
感染 的 暴发 ， 且 距离 核心 越 近 ， 感 染 能 力 越 强 。 意 味 着 cw- 壳 。 因素 r+- 壳 的 不 同 水 平 下 每 层 壳 的 感染 能 力 是 否 有 显著 性 差异 
分 解 方法 能 够 定位 具有 较 高 平均 扩散 能 力 节 点 ， 并 把 它 放 置 在 ”的 单 因素 方差 分 析 。 即 判断 网 络 分 层 结 构 对 节点 感染 能 力 是 否 
离 核心 近 的 位 置 。 有 显著 差异 。 数 据 如 表 4 所 示 。 


El 


为 了 进一步 给 出 量化 比较 , 可 以 通过 计算 不 精确 函数 e(p) 
来 衡量 这 些 指标 对 节点 重要 性 的 识别 准确 度 PYU， 公 式 如 下 : 


依据 单 因 素 方差 分 析 的 数学 模型 ,计算 组 内 离 差 平方 和 QE 
和 组 间 离 差 平方 和 QAP?11。 
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选择 检验 统计 量 下 值 : 
_6_(Q/ 全 区 - 守 mr( 太 -万 ) 
QO¢p (Qs/( ) a (MM, — My 


通过 下 临界 表 中 查 到 Fa (r-1,n-?) 的 值 。 


olg 
000 007 004 006 O08 


Qi0| 


QoxL 
000 


对 


3 cw- 壳 分 解 方法 与 度 指标 、 介 数 指标 不 精确 函数 对 比 


表 4 网 络 分 这 结果 


感染 能 力 M 壳 ”每 层 壳 每 个 节点 的 M 值 
1- 壳 MI Mi Mi3 
2- 壳 M21 M2 M23 
3- 壳 Mas! M3» M33 
过 Mr" Mr Ms 
为 了 检验 网 络 分 层 结构 对 节点 感染 能 力 是 否 有 显著 差异 ， 


在 检验 假设 成 立 条 件 下 ， 对 于 给 定 的 显著 性 水 平 a ， 可 以 


I 


本 文选 择 统计 软件 SPSS 进行 One-way ANOVA 分 析 ， 即 和 


天 


素 方 差分 析 (aqa=0.05 )。 
运行 结果 如 表 5、6 所 示 。 


表 5 网 络 Adolescent health(m=4) 每 层 壳 感染 能 力 的 方差 分 析 表 
方差 来 源 ” 离 差 平 方 和 和 ”自由 度 ” 均 方 离 差 “F 值 显著 性 
组 间 14.053 9 1.561 
组 内 16.459 2529 0.007 239.935 0.000 
总 和 30.512 2538 
表 6 网 络 US airport (m=1) 每 层 沉 感染 能 力 的 方差 分 析 表 
方差 来 源 ” 离 差 平 方 和 自由 度 ” 均 方 离 差 “F 值 ”显著 性 
组 间 9.825 6 1.638 
组 内 10.981 1567 0.007 ”233.677 0.000 
总 和 20.807 1573 


说 明 几 组 数据 之 
的 壳 结 构 ， 
壳 
差异 性 ， 可 以 进 
方法 可 以 
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表 5、6 为 方差 分 析 表 : 对 a =0.05, 从 显著 性 概率 看 , P<0.05 
显著 差异 。 即 ， 使 用 cw- 壳 分 解 方法 得 到 
可 以 有 效 的 对 网 络 进行 分 层 排序 ， 得 到 同 质 性 强 的 
结构 。 此 外 ， 还 可 以 通过 配对 比较 ， 计 算 每 层 壳 之 间 的 
步 验证 每 层 过 的 同 质 性 。 总 之 ， 使 用 cw- 壳 
9 效 的 对 网 络 进行 分 解 。 对 于 给 定 的 cw- 壳 值 ， 处 于 


瑟 


同 


于 cw- 壳 


3 


cw 层 的 节点 具有 相似 的 感染 能 力 ， 且 最 有 效 的 传播 者 位 
分 解 的 最 内 层 ， 具 有 最 大 的 cw 值 。 


结束 语 


本 文 提出 了 一 种 通用 的 旨 在 识别 加 权 有 向 网 络 中 心 节点 的 


方 
异 


少 


络 节 点 进行 重要 性 排序 ， 得 到 同 质 性 强 的 壳 结 构 ， 
上 共有 高 扩 


法 , cw- 过 分 解 方法 。 该 方法 综合 考虑 了 节点 


异 ， 以 及 权 值 在 真实 网 络 中 的 实际 重要 性 ， 对 美 到 Sn 网 和 青 


年 健康 网 络 的 仿真 研究 表明 ， 采 用 cw 指标 可 以 有 效 地 对 网 
能 够 识别 出 
散 能 力 的 节点 。 在 用 cw 指标 与 度 指标 和 介 数 指标 相 


较 时 ， 由 于 度 指标 和 介 数 指标 均 不 考虑 边 
所 以 比较 


即 


度 的 影响 力 是 不 同 的 。 


1 


的 方向 和 权 值 要 素 ， 
的 结果 并 不 理想 。 另 外 , 本 文 仅 讨论 4 =1/2 的 情况 ， 
度 和 入 度 同等 重要 ， 但 是 对 于 不 同 的 网 络 ， 出 度 和 入 
因此 需要 根据 特定 的 网 络 ， 进 一 步 讨论 


默认 出 


的 取 值 。 
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